
Google tuyên bố AI của họ đánh bại GPT-4 trong hầu hết các thử nghiệm, trong khi Microsoft cho biết GPT-4 tốt hơn, với những lời nhắc phù hợp.
Tuần trước, Google đã ra mắt AI mới, hay đúng hơn là mô hình ngôn ngữ lớn mới, được đặt tên là Gemini . Mô hình Gemini 1.0 có sẵn trong ba phiên bản: Gemini Nano được cho là phù hợp nhất cho các tác vụ trên một thiết bị cụ thể, Gemini Pro được cho là lựa chọn tốt nhất cho nhiều tác vụ hơn và Gemini Ultra là mô hình ngôn ngữ lớn nhất của Google. sẽ xử lý những nhiệm vụ phức tạp nhất mà bạn có thể giao cho nó.
>> Xem ngay: Mainboard WRX90 tăng tốc CPU AMD Threadripper PRO 7985WX lên 94% so với 7980X
Điều mà Google muốn nhấn mạnh khi ra mắt Gemini Ultra là mô hình ngôn ngữ này đã vượt trội hơn phiên bản mới nhất của GPT-4 của OpenAI ở 30 trong số 32 bài kiểm tra được sử dụng phổ biến nhất để đo lường khả năng của các mô hình ngôn ngữ. Các bài kiểm tra bao gồm mọi thứ, từ đọc hiểu và các câu hỏi toán học khác nhau đến viết mã cho Python và phân tích hình ảnh. Trong một số thử nghiệm, sự khác biệt giữa hai mô hình AI chỉ là vài phần mười điểm phần trăm, trong khi ở những thử nghiệm khác, con số này lên tới 10 điểm phần trăm.
Tuy nhiên, có lẽ thành tích ấn tượng nhất của Gemini Ultra là mô hình ngôn ngữ đầu tiên đánh bại các chuyên gia về con người trong các bài kiểm tra hiểu ngôn ngữ đa nhiệm (MMLU) quy mô lớn, trong đó Gemini Ultra và các chuyên gia phải đối mặt với các nhiệm vụ giải quyết vấn đề trong 57 lĩnh vực khác nhau, từ toán học và vật lý đến y học, luật và đạo đức. Gemini Ultra đã đạt được số điểm 90,0%, trong khi chuyên gia về con người mà nó được so sánh với “chỉ” đạt được 89,8%.
Sự ra mắt của Gemini sẽ diễn ra dần dần. Tuần trước, Gemini Pro đã ra mắt công chúng khi chatbot Bard của Google bắt đầu sử dụng phiên bản sửa đổi của mô hình ngôn ngữ và Gemini Nano được tích hợp vào một số chức năng khác nhau trên điện thoại thông minh Pixel 8 Pro của Google. Gemini Ultra vẫn chưa sẵn sàng ra mắt công chúng. Google cho biết họ vẫn đang trong quá trình thử nghiệm bảo mật và chỉ được chia sẻ với một số nhà phát triển và đối tác cũng như các chuyên gia về trách nhiệm pháp lý và bảo mật AI. Tuy nhiên, ý tưởng là cung cấp Gemini Ultra cho công chúng thông qua Bard Advanced khi nó ra mắt vào đầu năm tới.

Microsoft hiện đã phản bác lại tuyên bố của Google rằng Gemini Ultra có thể đánh bại GPT-4 bằng cách cho GPT-4 chạy lại các bài kiểm tra tương tự, nhưng lần này với các lời nhắc hoặc đầu vào được sửa đổi một chút. Các nhà nghiên cứu của Microsoft đã công bố nghiên cứu vào tháng 11 về thứ mà họ gọi là Medprompt , một sự kết hợp của nhiều chiến lược khác nhau để đưa lời nhắc vào mô hình ngôn ngữ nhằm đạt được kết quả tốt hơn. Bạn có thể nhận thấy câu trả lời bạn nhận được từ ChatGPT hoặc hình ảnh bạn nhận được từ trình tạo hình ảnh của Bing hơi khác một chút khi bạn thay đổi cách diễn đạt một chút. Khái niệm đó, nhưng cao cấp hơn nhiều, là ý tưởng đằng sau Medprompt.
Bằng cách sử dụng Medprompt, Microsoft đã cố gắng làm cho GPT-4 hoạt động tốt hơn Gemini Ultra trong một số trong số 30 bài kiểm tra mà Google đã nêu bật trước đó, bao gồm cả bài kiểm tra MMLU, trong đó GPT-4 với đầu vào Medprompt đã đạt được số điểm 90,10%. Mô hình ngôn ngữ nào sẽ thống trị trong tương lai vẫn còn phải xem. Cuộc chiến giành ngai vàng AI còn lâu mới kết thúc.
>> Xem thêm các bài viết liên quan:
Rò rỉ thông tin Intel Core i3-14100 sẽ ra mắt vào ngày 8/1/2024
Card màn hình GeForce RTX 4090 do Redditor thiết kế với ba quạt Noctua